অ্যাপাচি পিওআই (Apache POI) ব্যবহার করে Word ডকুমেন্ট থেকে টেক্সট এক্সট্র্যাকশন (Text Extraction) এবং টেক্সট প্রতিস্থাপন (Text Replacement) দুটি খুবই গুরুত্বপূর্ণ কার্যাবলী। এই কার্যাবলীর মাধ্যমে আপনি .docx ফাইল থেকে টেক্সট পড়তে বা পরিবর্তন করতে পারবেন। Apache POI এর XWPF API এর মাধ্যমে এই কাজগুলো সঞ্চালন করা সম্ভব।
Text Extraction এর মাধ্যমে আপনি Word ডকুমেন্ট থেকে নির্দিষ্ট প্যারাগ্রাফ বা টেক্সট বের করে আনতে পারেন। এটি বিশেষভাবে প্রয়োজনীয় যখন আপনি ডকুমেন্টের কোনো তথ্য বিশ্লেষণ বা প্রক্রিয়া করতে চান।
import org.apache.poi.xwpf.usermodel.*;
import java.io.*;
public class ExtractTextFromWord {
public static void main(String[] args) throws IOException {
// Word ডকুমেন্ট লোড করা
FileInputStream file = new FileInputStream(new File("example_word_document.docx"));
XWPFDocument document = new XWPFDocument(file);
// সমস্ত প্যারাগ্রাফ থেকে টেক্সট বের করা
for (XWPFParagraph paragraph : document.getParagraphs()) {
System.out.println(paragraph.getText());
}
// ডকুমেন্ট বন্ধ করা
file.close();
}
}
XWPFDocument
ক্লাস ব্যবহার করে .docx ডকুমেন্টটি লোড করা হয়।getParagraphs()
মেথড ব্যবহার করে সমস্ত প্যারাগ্রাফ থেকে টেক্সট পাওয়া যায়। প্রতিটি প্যারাগ্রাফের টেক্সট getText()
মেথডের মাধ্যমে এক্সট্র্যাক্ট করা হয়।এছাড়াও, আপনি টেবিলের মধ্যে থাকা টেক্সটও এক্সট্র্যাক্ট করতে পারেন একই পদ্ধতিতে।
Text Replacement এর মাধ্যমে আপনি ডকুমেন্টের মধ্যে একটি নির্দিষ্ট টেক্সট পরিবর্তন করতে পারেন। এটি তখন ব্যবহারযোগ্য যখন আপনাকে কোনো টেক্সট ফাইলের মধ্যে বিশেষ শব্দ বা বাক্য পরিবর্তন করতে হয়।
import org.apache.poi.xwpf.usermodel.*;
import java.io.*;
public class ReplaceTextInWord {
public static void main(String[] args) throws IOException {
// Word ডকুমেন্ট লোড করা
FileInputStream file = new FileInputStream(new File("example_word_document.docx"));
XWPFDocument document = new XWPFDocument(file);
// ডকুমেন্টের সকল প্যারাগ্রাফ থেকে টেক্সট পরিবর্তন করা
for (XWPFParagraph paragraph : document.getParagraphs()) {
String paragraphText = paragraph.getText();
if (paragraphText.contains("old text")) {
// পুরনো টেক্সট "old text" নতুন টেক্সট "new text" দিয়ে প্রতিস্থাপন করা
paragraphText = paragraphText.replace("old text", "new text");
// নতুন টেক্সট সেট করা
XWPFRun run = paragraph.createRun();
run.setText(paragraphText);
}
}
// ডকুমেন্ট সংরক্ষণ করা
try (FileOutputStream out = new FileOutputStream("updated_word_document.docx")) {
document.write(out);
}
// ডকুমেন্ট বন্ধ করা
file.close();
System.out.println("টেক্সট সফলভাবে প্রতিস্থাপিত হয়েছে!");
}
}
XWPFDocument
ক্লাস ব্যবহার করে ডকুমেন্টটি লোড করা হয়।getText()
মেথডের মাধ্যমে প্যারাগ্রাফের টেক্সট নেওয়া হয়। তারপর, replace()
মেথড ব্যবহার করে পুরনো টেক্সট নতুন টেক্সটে প্রতিস্থাপন করা হয়।Apache POI এর XWPF API ব্যবহার করে আপনি সহজেই Word ডকুমেন্ট থেকে টেক্সট এক্সট্র্যাক্ট করতে পারেন এবং টেক্সট প্রতিস্থাপন করতে পারেন। Text Extraction এর মাধ্যমে আপনি ডকুমেন্টের সমস্ত টেক্সট পড়তে পারেন, এবং Text Replacement এর মাধ্যমে আপনি নির্দিষ্ট টেক্সট পরিবর্তন করতে পারবেন। এই প্রক্রিয়াগুলি ডকুমেন্টের ভেতরের কনটেন্ট পরিবর্তন বা বিশ্লেষণের জন্য খুবই কার্যকর।
common.read_more